iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 14
0
AI & Data

時間管理大師-時間序列分析終極密技系列 第 14

[Day14]蹉跎錯,消磨過-宗師級資料分析模組!!NumPy

  • 分享至 

  • xImage
  •  

NumPy

NumPy是python的一個重要模組,主要用在資料分析,支援大量的高階維度陣列與矩陣運算,NumPy 底層以 C 和 Fortran 語言開發,因此運算效能狠狠碾壓python的列表運算,當今絕大部分S級資料分析套件(Pandas、SciPy、Scikit-learn、matplotlib),都跟NumPy脫離不了關係,因此為了學習其他資料科學相關套件,我們必須在NumPy上打好堅實的基礎。

NumPy操作

安裝

請在終端機底下輸入這個,謝謝
pip install numpy

載入NumPy

像這樣

import numpy as np

np是世俗公認的numpy簡稱,如果要使用其他numpy的別名,請三思而後行

NumPy陣列

相較於python的list,他們最大的差別就是list能夠儲存不同資料型態的資料,而NumPy陣列只能儲存相同的資料型態,但效能帶來的極致體驗,還是讓NumPy在處理大量資料中獨霸一方,陣列操作可以說是NumPy招牌,其特色為同質且支援多重維度的ndarray物件,這個物件的三個重要屬性分別為:
維度(ndim)
形狀(shape)
資料型態(dtype)
一般我們稱一維陣列為vector而二維陣列為matrix,使用方法如下

基本操作

# 載入numpy模組
import numpy as np

if __name__ == "__main__":
    # 以列表來建立numpy陣列
    l1 = [12, 14, 0, 5, 23]
    a1 = np.array(l1)
    
    l2 = [17, -5, 28, 5, 6]
    a2 = np.array(l2)

    # 陣列相加
    print(a1 + a2)
    # [29  9 28 10 29]

    # 顯示重要屬性
    print(a1.ndim)
    # 1 => 一維陣列
    print(a1.shape)
    # (5,) => 五個元素
    print(a1.dtype)
    # int64 => 資料型態

    # 存取資料
    print(a1[3])
    # 5 # 載入numpy模組
import numpy as np

if __name__ == "__main__":
    # 以列表來建立numpy陣列
    l1 = [12, 14, 0, 5, 23]
    a1 = np.array(l1)
    
    l2 = [17, -5, 28, 5, 6]
    a2 = np.array(l2)

    # 陣列相加
    print(a1 + a2)
    # [29  9 28 10 29]

    # 顯示重要屬性
    print(a1.ndim)
    # 1 => 一維陣列
    print(a1.shape)
    # (5,) => 五個元素
    print(a1.dtype)
    # int64 => 資料型態
    

維度轉換

import numpy as np

if __name__ == "__main__":
    # 以列表來建立numpy陣列
    l1 = [12, 14, 0, 5, 23, 3]
    a1 = np.array(l1)
    print(a1)
    # [12, 14, 0, 5, 23, 3]

    # 顯示重要屬性
    print(a1.ndim)
    # 1 => 一維陣列
    print(a1.shape)
    # (6,) => 六個元素
    print(a1.dtype)
    # int64 => 資料型態
    
    # 維度轉換
    a1 = a1.reshape([2, 3])
    print(a1)
    # [[12 14  0] [ 5 23  3]]
    # 顯示重要屬性
    print(a1.ndim)
    # 2 => 二維陣列
    print(a1.shape)
    # (2, 3) => 2*3個元素
    print(a1.dtype)
    # int64 => 資料型態

轉換資料型態

import numpy as np

if __name__ == "__main__":
    # 以列表來建立numpy陣列
    l1 = [12, 14, 0, 5, 23, 3]
    a1 = np.array(l1)
    print(a1)
    # [12, 14, 0, 5, 23, 3]
    print(a1.dtype)
    # int64 => 資料型態
    
    # 轉換資料型態
    a1 = a1.astype("float32")
    print(a1)
    # [12. 14.  0.  5. 23.  3.]
    print(a1.dtype)
    # float32 => 資料型態

取一小部份的陣列(切片)

import numpy as np

if __name__ == "__main__":
    # 以列表來建立numpy陣列
    l1 = [12, 14, 0, 5, 23, 3]
    a1 = np.array(l1)
    print(a1)
    # [12, 14, 0, 5, 23, 3]
    
    print(a1[0:3])
    # 從第0個開始取,取到第3個之後不取
    # [12 14  0]

    print(a1[4:6])
    # 從第4個開始取,取到第6個之後不取
    # [23  3]

過濾

import numpy as np

if __name__ == "__main__":
    # 以列表來建立numpy陣列
    l1 = [12, 14, 0, 5, 23, 3]
    a1 = np.array(l1)
    print(a1)
    # [12, 14, 0, 5, 23, 3]

    # 用布林遮罩來過濾資料
    mask = a1 % 2 == 0
    print(mask)
    # [ True  True  True False False False]
    print(a1[mask])
    # [12 14  0]

上一篇
[Day13]今越紅塵亦悠悠-參透過去,解析未來,時間序列之資料清理概論
下一篇
[Day15]最是光陰化浮沫-真正的計算機,NumPy矩陣
系列文
時間管理大師-時間序列分析終極密技30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言